گسترش پرس و جو در موتور جستجوی فارسی

thesis
abstract

پرس وجو برای بیان نیازهای کاربران به اطلاعات موجود در صفحات وب و سایر منابع، مطرح می شود. پرس وجوهای کاربران معمولاً «بسیار کوتاه» و شامل دو یا سه کلمه می باشند. قابلیت زبان های مختلف در بیان یک مفهوم با چندین کلمه مترادف و وجود یک کلمه با بیش از یک معنی، منجر به مشکل «عدم تطابق کلمه» و «مبهم بودن پرس وجو» می شوند. در نتیجه تعداد زیادی اسناد غیرمرتبط بازیابی شده و دقت کاهش می یابد. برای رفع این مشکلات از تکنیک گسترش پرس وجو استفاده می شود که از طریق پیشنهاد و افزودن واژگان مناسب به پرس وجوی کاربر، موجب بهبود دقت بازیابی خواهد شد. مهمترین مسئله، تشخیص و انتخاب واژه خوب برای افزودن به پرس وجوی کاربر می باشد. در مباحث گسترش پرس وجو دو عامل مهم «روش انتخاب واژگان گسترش» و «منابع واژگان گسترش» وجود دارد. در این پایان نامه با درنظر گرفتن ویژگی های زبان فارسی و مسائل مرتبط با آن، به بررسی گسترش پرس وجو در موتور جستجوی فارسی می پردازیم. برای این کار از هستان شناسی عمومی فارس نت و شبکه مفهوم استفاده می کنیم که در برگیرنده روابط میان مفاهیم و کلمات می باشد. پس از دریافت پرس وجوی کاربر از طریق مطابقت آن با شبکه مفهوم، گروهی از کلمات مرتبط با پرس وجوی کاربر استخراج می شوند و در مرحله بعد مطابق الگوریتم ارائه شده، رتبه بندی می شوند. در پایان تعدادی از کلمات بسیار مرتبط با پرس وجوی کاربر به صورت خودکار به پرس وجوی اولیه کاربر افزوده می شوند و پرس وجوی گسترش یافته مورد جستجو قرار می گیرد. نتایج آزمایش های انجام شده، نشان دهنده بهبود عملکرد و افزایش دقت بازیابی می باشد.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

گسترش معنایی پرس و جو

بازیابی اطلاعات یکی از اصلی ترین نیازهای کاربران است؛ روزانه کاربران زیادی به جستجو در وب و دیگر منابع به منظور پاسخ گویی به نیاز اطلاعاتی خود می پردازند. مسائل موجود در زبان طبیعی از جمله عدم تطابق لغوی، کلمات چند معنایی، کوتاه و مبهم بودن پرس وجو و دانش ناقص کاربران از موضوع مورد نظر در بازیابی اطلاعات منجر به بازیابی نتایج نامرتبط و کاهش رضایت کاربران از نتایج بازیابی شده می شود. گسترش پرس و...

15 صفحه اول

ارزیابی همپوشانی و پوشش چهار موتور جستجوی بومی اصلی: پارسی جو، یوز، پارسیک و ریسمون

هدف: پژوهش حاضر با هدف  سنجش همپوشانی موتورهای جستجوی بومی پارسی جو، یوز، پارسیک، و ریسمون و مقایسه توانمندی‌های  این موتورها در  پوشش دادن وب نمایه‌پذیر انجام گرفت. روش: پژوهش از نوع کاربردی ارزیابانه بود. برای گردآوری اطلاعات از روش مبتنی بر کلیدواژه بهره گرفته شد، بدین ترتیب ابتدا کلیدواژه‌های انتخاب شده به موتورهای جستجو ارائه و از رکوردهای بازیابی شده نمونه‌گیری و با توجه به وجود یا نبود ا...

full text

الگوهای تعامل و راهبردهای بازآرایی پرس‌و‌جو توسط کاربران در یک موتور جستجوی فارسی

فرایند جستجو در وب با زندگیِ برخط امروزی عجین شده است. موتورهای جستجو، با دریافت پرس‌وجوهای کاربران، تعداد محدودی از اسناد مرتبط را از میان چندین میلیارد صفحۀ وب بازیابی می‌کنند. بنابراین موتورهای جستجو با ثبت مجموعۀ پرس‌وجوهای کاربران در درازمدت می‌توانند به مجموعه‌ای از اطلاعات دربارۀ الگوهای رفتاری کاربران دست یابند. این الگوها می‌توانند در فرایندهایی مانند گسترش پرس‌وجو، پیشنهاد پرس‌وجو و تص...

full text

کشف الگوی کلیک کاربران برای استفاده در پرس و جو

مقدمه: در طراحی موتورهای جستجو، بررسی پایگاه داده ی مورد مطالعه و ایجاد ارتباط با آن حائز اهمیت است. روش تحقیق: پژوهش حاضر از نوع کاربردی است که با استفاده از روش مشاهده اجرا می شود. آنچه که در پژوهش حاضر بکار رفته روش مطالعه موردی است. یافته ها: الگوی اغلب جستجوهای انجام شده، در بیشتر موارد به صورت کلی به جزئی و اختصاصی است. شرکت کنندگان جستجویشان را با اطلاعات کلی مانند معرفی و بر...

full text

الگوریتم بازیابی و رتبه‌بندی اطلاعات در موتور جستجوی گوگل

هدف اساسی این مقاله، تبیین نحوه عمل موتور جستجوی گوگل در رتبه‌بندی اطلاعات بازیابی شده است و بدین منظور، الگوریتم (خوارزمی) موتور جستجوی گوگل را در بازیابی و رتبه‌بندی اطلاعات بررسی می‌کند. در بخش اول – که text matching نامیده می‌شود – شیوه یافتن اطلاعات مرتبط با واژه‌های واردشده در جعبه جستجو، به‌طور خلاصه بیان می‌گردد و در بخش دوم – که بخش اصلی مقاله است و PageRank نام دارد – شیوه رتبه‌بندی ن...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023